Новостное агентство «Хавза» |
Письменное наследие исламского мира является одним из крупнейших цивилизационных хранилищ человечества — сокровищницей, значительная часть которой до сих пор остаётся неизвестной, разрозненной и недоступной для исследователей. В таких условиях создание единой базы рукописей следует считать стратегическим шагом на пути интеллектуального возрождения этого великого наследия; шагом, который может изменить наше отношение к научному и культурному капиталу предшествующих поколений.
Значение этой платформы не ограничивается лишь сбором рукописей. Объединение информации о манускриптах, определение мест их хранения, интеграция данных и обеспечение доступа исследователей фактически создают новую инфраструктуру для переосмысления исламского наследия. На протяжении многих лет часть рукописей хранится в крупных библиотеках, а часть — в небольших и разрозненных коллекциях, и именно эта разобщённость затрудняет исследовательскую работу. Единая база рукописей может сократить этот разрыв и представить первую чёткую карту наших письменных источников.
Главное значение этого проекта становится особенно очевидным, если рассматривать его как подготовительный этап для внедрения искусственного интеллекта в сферу рукописей. Если рукописи будут системно идентифицированы и оцифрованы, на следующих этапах их можно будет превратить в тексты с возможностью поиска, сопоставлять разные версии одного произведения между собой и облегчить процесс критического издания и восстановления текстов. Именно в этой точке процесс возрождения наследия из трудоёмкой и ограниченной работы превращается в интеллектуализированный и ускоренный процесс.
По сути, единая база рукописей — это не просто информационный банк, а стартовая платформа для возвращения письменного исламского наследия в современную научную жизнь. Чем точнее и шире будет сформирована эта инфраструктура, тем больше будет возможностей для обнаружения неизвестных произведений, определения приоритетных текстов и их научного использования. С этой точки зрения данную платформу следует рассматривать не как обычный проект, а как начало цивилизационного преобразования в сфере сохранения и интеллектуального возрождения исламского наследия.
Ходжат-аль-ислам валь-муслимин Акбар Рашди-Ния, заместитель по научной работе Центра компьютерных исследований исламских наук «Нур», в интервью новостному агентству «Хавза» рассмотрел этот вопрос и представил отчёт о создании базы рукописей этого центра. Ниже приводится полное изложение беседы:

Самая крупная база данных научного наследия исламского мира на пороге открытия / 5 миллионов рукописей ожидают возрождения
Вопрос: Ранее появлялись новости о скором запуске единой базы рукописей как первой национальной платформы манускриптов. Пожалуйста, поясните детали этого проекта и когда планируется его официальное открытие?
Единая база рукописей создаётся в рамках основной миссии Центра компьютерных исследований исламских наук. В чём заключается миссия центра? Основная миссия — облегчение доступа исследователей к источникам и первичным материалам исламских наук.
Миссия центра «Нур»: облегчение доступа к источникам исламских наук
В рамках этой миссии необходимо, во-первых, выявление источников, во-вторых — их оцифровка, и в-третьих — анализ и обогащение данных. Эта работа ведётся уже почти четыре десятилетия.
Источники исламских наук существуют в различных формах, включая печатные книги. За эти четыре десятилетия центр смог выявить, оцифровать и обработать около 150 тысяч томов книг в области исламских наук, которые представлены в системе «НурЛайб».
Часть этих ресурсов, особенно современные исследования, существует в виде научных журналов, сборников статей и периодики. Около двух миллионов научных статей, опубликованных за последние 150 лет в различных регионах исламского мира, были выявлены и полностью оцифрованы и размещены в системе «НурМагз».
Вопрос: Вы сами осуществляете мониторинг и выявление этих работ в исламском мире?
Да. В центре существует команда, которая занимается поиском источников и отслеживает всё, что публикуется в исламском мире, действуя на основе приоритетов и доступности.
Иногда журнал публикуется в какой-либо точке исламского мира, например в Египте, и мы не можем получить к нему доступ. Поэтому, исходя из важности темы и возможности доступа, осуществляется подбор материалов, после чего проводится их оцифровка.
Мониторинг источников исламского мира по приоритетам и доступности
Третья категория научного наследия — это диссертации, которые относятся к современному периоду. С момента формирования современных университетов, примерно за последние 70–100 лет, было создано большое количество диссертаций внутри страны и за её пределами.
Они были выявлены, заключены соответствующие соглашения с университетами, проведена координация, и эти диссертации собраны, оцифрованы и представлены исследователям в системе «НурЛайб». Они охватывают исламские и гуманитарные науки.
В настоящее время в этой системе доступно около 160–170 тысяч диссертаций, и исследователи могут пользоваться этими материалами.
Представление 170 тысяч диссертаций в системе
Третья форма научного наследия мира — это рукописи, которые считаются самым древним пластом нашего наследия. Именно книги, о которых говорилось ранее, во многом являются результатом реконструкции, критического издания и публикации этих рукописей; значительная их часть уже размещена в «НурЛайб».
Эти рукописи обладают чрезвычайно высокой значимостью. Один из аспектов их важности — это их количество. Да, их число действительно значительное. Как я уже упоминал, в системе «НурЛайб» у нас сейчас около 150 тысяч томов книг.
Если рассматривать важные источники исламского мира среди уже опубликованных текстов, то эти 150 тысяч томов не все относятся к древним текстам. Возможно, около 50% из них, то есть примерно 70 тысяч томов, относятся к нашим классическим древним текстам.
50 тысяч наименований древних текстов в распоряжении центра «Нур»
То есть знания, которые были произведены на географии исламского мира — от самой восточной точки, которую можно считать Китаем, до самой западной, например Андалусии — за этот исторический период, сегодня представлены у нас примерно 50 тысячами наименований этих произведений, охватывающих период около 1300–1400 лет.
Если считать последние 200 лет современными книгами, то до этого, примерно в течение 1000–1200 лет, не существовало печатного дела. Поэтому у нас есть тысяча лет научного производства, представленного в виде рукописей.
Каков их объём? Каков масштаб? В отношении рукописей исламского мира существует институт в Англии под названием Институт аль-Фуркан, который занимается исследованием манускриптов и находится под руководством саудовского деятеля по имени Заки аль-Ямани — бывшего министра нефти Саудовской Аравии, который в годы восьмилетней оборонительной войны (ирано-иракской войны) занимал этот пост.
Он основал в Англии институт, специализирующийся на рукописях и их изучении. Эта организация, исходя из своих исследовательских предположений, оценивает, что точной цифры у нас пока нет, но по их приблизительным расчётам в географии исламского мира существует около 5 миллионов рукописей.
Оценка в 5 миллионов рукописей в исламском мире
Сколько из этих пяти миллионов рукописей опубликовано? Даже не 10%, даже не 8%. Из всего этого объёма, накопленного во всём мире с момента появления книгопечатания до настоящего времени, опубликована лишь очень малая часть.
Фактически, около 90% этого наследия до сих пор недоступно. С количественной точки зрения это одна из крупнейших областей научного наследия, и это естественно, поскольку в исламском мире более тысячи лет велась научная деятельность.
Великие учёные исламского мира — от философов, таких как Авиценна (Ибн Сина) и Аль-Фараби, до Аль-Газали, Фахр ад-Дина ар-Рази и Хадже Насир ад-Дина Туси, а также великих факихов, таких как шейх Садук и шейх Туси, вплоть до таких личностей, как Шахид Сани и Нараки — оставили множество трудов, значительная часть которых до сих пор не опубликована.
90% письменного наследия всё ещё недоступно
Даже в тех областях, которые сегодня крайне необходимы, ситуация остаётся аналогичной. Например, мы сейчас нуждаемся в глубоких знаниях о молитвах и дуа. Говорится, что имамы (мир им) часто не могли открыто передавать свои слова через проповеди или публичные беседы, поэтому они выражали их в форме молитв.
Значительная часть высоких мистических и духовных смыслов исламской традиции содержится именно в этих дуа. Они существуют, но кто должен их извлекать и исследовать? Конечно, за тысячу лет в этой области уже проводилась работа, и её немало.
Я сам когда-то изучал только рукописи, имеющиеся в Иране: существует более нескольких сотен рукописей, посвящённых комментариям к молитвам — например, комментарии к дуа Кумейл, дуа Нудба, дуа Самаат и другим.
Однако ни одно из этих произведений полностью не опубликовано; лишь небольшая часть была издана. Поэтому эти источники чрезвычайно важны как с количественной, так и с качественной точки зрения, поскольку они охватывают область знаний, в которой ещё сделано очень мало.
Рукописи как сокровищница забытых знаний
Здесь содержится информация. Сами тексты книг — это отдельная тема, но даже сами рукописи являются документами. Каждая страница рукописи — это своего рода свидетельство.
Почему это считается документом? Потому что иногда на полях великий учёный оставлял заметки, которые могут решить важные вопросы — например, исторические проблемы, фикхские (юридические) вопросы или комментарии к определённым темам.
Иногда он мог упомянуть что-то о своём учителе, о котором у нас не было никакой информации, но в этой самой рукописи, даже не в основном тексте, а на полях, содержится чрезвычайно важное замечание.
Поэтому область рукописей является чрезвычайно важной сферой, однако работа в этой области, естественно, является тяжёлой и сложной. Эта сфера из-за своей огромной разрозненности требует больших усилий.
Рукописи — по листам как исторические документы
Даже в нашей собственной стране существуют десятки центров, частных лиц и организаций, которые хранят рукописи. Если исследователь захочет получить доступ к какому-либо манускрипту, к значительной части этих материалов он не сможет легко получить доступ.
Например, предположим, что вы прочитали, что определённая рукопись какой-либо книги находится в библиотеке — например, в библиотеке в Мешхеде или в другой библиотеке. Даже крупные библиотеки имеют множество сложностей.
Кроме того, иногда это небольшие библиотеки, которые содержат сто, двести или тысячу рукописей. В таком случае как мне найти нужную рукопись? Нужно вести переписку, ездить туда, проходить различные этапы, и в итоге, возможно, вы получите только изображение этой рукописи.
Трудность доступа исследователей к рукописям
Поэтому одной из важнейших задач в этой сфере, учитывая сложность доступа и разрозненность источников, является создание единой базы данных, где все рукописи будут зарегистрированы, их каталоги будут доступны, и с помощью соответствующего механизма можно будет легко получить доступ к их изображениям.
Реализация этого является одной из самых необходимых исследовательских задач. В мире эта область также считается крайне важной. Европейский союз утвердил несколько проектов, значительная часть которых посвящена рукописям, и на них были выделены средства.
Например, один из таких проектов касался манускриптов по теологии зейдитов. В рамках этого проекта была создана группа, которая занималась исследованиями вероучения зейдитов. Западная исследовательская команда в рамках крупного проекта отправлялась в Йемен, приезжала в Иран и работала также в Турции.
Необходимость создания единой базы рукописей
Другой проект, с членами которого я имел возможность лично встретиться, также финансировался Европейским союзом. Это была команда, которая занималась сбором рукописей трёх крупнейших философов исламского мира — аль-Фараби, Ибн Сины и Муллы Садры.
Что касается Муллы Садры, они считали, что большая часть его произведений находится в Иране, поэтому приезжали сюда и некоторое время работали в стране.
Руководителем группы был человек ливанского происхождения, одновременно французский университетский профессор. Он был по происхождению ливанцем, но имел французское гражданство и научный статус.
Тем не менее, в нашей стране до сих пор, возможно, не было проведено столь масштабной и комплексной работы в этой сфере.
Некоторые шаги и проекты уже предпринимались, но полноценного комплексного проекта, охватывающего всё, пока не было реализовано. Центр исследований также, в рамках своей миссии, о которой я говорил ранее, приступил к этой работе.
Фактически, это одна из важных потребностей исследователей, и до сих пор никто не предпринял комплексного решения этой задачи. Да, например, Национальная библиотека, естественно, должна работать со своими коллекциями рукописей, но в широком и системном виде такого проекта пока нет. В то время как в мире подобные инициативы уже реализуются.
В Турции Министерство культуры и туризма создало систему, в которой представлены рукописи со всей страны, и предусмотрены способы получения их изображений.
Вопрос: Вы использовали опыт других стран?
На данный момент европейские страны действуют точечно и фрагментарно. Например, университеты Мичигана, Принстона и Гарварда создавали системы для работы с рукописями, особенно восточными и исламскими манускриптами, но эти инициативы разрознены.
Однако, насколько я видел в этих исследованиях, Турция в этом отношении более продвинута по сравнению с другими странами, хотя и там существует множество проблем.
Главная проблема Турции заключается в том, что их язык и письменность были изменены, и в результате они оказались отдалены от своей 1400-летней или 1200-летней традиции. Тексты были написаны на арабском, персидском и османско-турецком языках, однако они изменили основу и преобразовали свою алфавитную систему. Именно это сейчас делает восстановление информации крайне сложным.
Например, у них нет буквы «х». Если вы ищете слово вроде «сокровища» (ذخایر), вам нужно знать, как это слово там записывается. Кроме того, существует ряд других проблем: алфавитная система была полностью заменена на другую, при этом для каждой буквы не существует точного и единого соответствия. Также появились звуки, которых в прежней системе не существовало. Всё это создаёт дополнительные трудности.
Фрагментарная деятельность Запада и относительное лидерство Турции
Как я уже говорил, это лишь один этап — этап, в котором мы занимаемся идентификацией и также цифровизацией. Есть и другой этап, который можно считать особенностью Центра компьютерных исследований исламских наук, — это анализ и обогащение данных.
Откуда возникает этот этап? Он появляется из накопления данных и их разнообразия. Учитывая этот массив, мы провели ряд исследовательских работ и тематическую, неструктурную разметку источников, чтобы облегчить поиск информации.
Анализ и обогащение — уникальное преимущество центра «Нур»
Можно, конечно, создать сайт и сказать: «У нас есть 100 тысяч или даже миллион книг». Это одна сторона вопроса. Но другой вопрос — можно ли полноценно искать по текстам этих книг? Есть ли тематическая разметка их содержания? Размечены ли аяты? Размечены ли хадисы? Размечены ли стихи? Аналогично — журналы. Затем осуществляется взаимосвязанность между этими данными.
Например, хадис, который есть в системе «НурМагз», может иметь комментарий в другой базе данных. Сам хадис есть в одном месте, но его объяснение находится в другой системе, где мы уже выполнили его научное разъяснение.
От простого поиска к разметке и связям данных
Такая обогащённая информационная обработка и аналитика значительно упростили доступ к данным. Одним из проектов, который сейчас находится на стадии завершения и скоро будет запущен, является перевод всех статей «НурМагз» на три языка — то есть система станет трёхъязычной: персидский, арабский и английский.
Как известно, одной из научных проблем нашей страны было то, что значительная часть научной продукции, особенно в области гуманитарных наук, создавалась на персидском языке. Из-за этого мы были в определённой степени оторваны как от исламского мира, так и от всего мира в целом — поскольку за пределами страны далеко не все владеют персидским языком.
Эти материалы также не отображались в поисковых системах таким образом, чтобы направлять зарубежных исследователей к нам. Человек мог искать информацию, но никогда не находил наши статьи, чтобы затем перевести их — вручную или с помощью искусственного интеллекта.
Однако теперь, благодаря принятым мерам, все статьи, созданные за последние сто лет в области исламских и гуманитарных наук, переведены как на арабский, так и на английский языки.
Эта информация передаётся поисковым системам, и в результате, если человек в США будет искать этот материал, он будет направлен к этим источникам и получит к ним доступ. То же самое происходит и в Египте: при поиске пользователь также будет перенаправлен к этому источнику. Это осуществляется в рамках процесса обогащения контента.
Трёхъязычный «НурМагз»(NoorMags) и преодоление языковых границ
В области рукописей ситуация будет следующей: мы не ограничиваемся созданием только базы данных манускриптов. Это лишь первый шаг — объединение, регистрация и обеспечение доступности рукописей.
Второй шаг — это переход к этапу обогащения данных. Что означает обогащение рукописей? Это означает, что для каждой страницы рукописи, если существует её печатное издание, оно также будет отображаться рядом.
Должна быть создана среда, в которой возможен поиск по рукописям и их содержанию. Сегодня технологии достигли такого уровня, что позволяют с определённой долей погрешности восстанавливать содержание этих текстов. В печатных текстах это, конечно, проще, но и в области рукописей технологии уже значительно продвинулись.
Мы также работаем над тем, чтобы на следующем этапе сделать эти рукописи поисковыми — с определённой степенью погрешности, так чтобы при поиске система могла показывать, что искомое содержание совпадает или близко к содержанию данной страницы рукописи.
Второй этап: рукописи, доступные для поиска
Также необходимо предоставить исследователям и текстологам систему, которая с помощью интеллектуальных технологий будет облегчать процесс критического издания текстов.
Как я уже говорил, в мире существует около пяти миллионов рукописей. В области исламских наук эти цифры приблизительно оценены, и считается, что из этих пяти миллионов около полутора миллионов уже каталогизированы и идентифицированы — то есть известно, что они собой представляют.
Примерно одна треть уже описана, а около двух третей находятся в разрозненном виде у разных владельцев и до сих пор не каталогизированы.
Даже в крупных библиотеках — таких как Национальная библиотека, библиотека Мараши Наджафи и библиотека святилища Имама Резы(мир ему)— существует множество рукописей, которые ещё не описаны и не внесены в каталоги, и мы даже не знаем, что именно в них содержится. И это также является серьёзной проблемой.
1,5 миллиона каталогизированных рукописей и миллионы неизвестных
Что касается этих 1,5 миллионов известных рукописей, следует отметить, что исламский мир за последние 100–120 лет приложил огромные усилия для их редактирования, исправления, возрождения, печати и предоставления людям. Однако в итоге, возможно, было опубликовано лишь около 150–200 тысяч книг из этого массива. Таким образом, мы всё ещё очень далеки от цели, при которой все эти произведения будут систематизированы и опубликованы.
Нам необходимо иметь инструменты, которые позволят снизить трудности печати, трудности восстановления и даже трудности распознавания этих произведений. Сейчас часть уже отредактированных и опубликованных работ вовсе не относится к числу самых важных.
Например, у меня в библиотеке или у другого человека может быть рукопись, и я, занимаясь исследованием, решаю, что это хорошая книга, беру её и редактирую. Но среди этих рукописей есть такие произведения, которые могут даже изменить историю науки.
Однако ни один из этих материалов до сих пор должным образом не систематизирован. Первый этап заключался в том, чтобы понять, что именно у нас есть, и на этой основе определить приоритеты. Именно этот процесс сейчас облегчает создаваемая платформа: исследователи могут увидеть, что многие великие фигуры исламского мира всё ещё имеют неопубликованные труды.
Также существует множество очень важных книг в различных областях — фикха, усуля, тафсира, философии, калама и ирфана — десятки, а возможно, сотни и тысячи произведений, которые до сих пор не изданы.
Большой разрыв между наследием и его публикацией
Другой вопрос заключается в том, можем ли мы предоставить исследователю и редактору инструмент, который позволит сократить время работы с рукописью.
Например, если критическое издание одной рукописи занимает год, возможно ли сократить это время до двух месяцев или даже одного месяца? Следующий наш шаг — предоставить исследователям инструменты, которые позволят машине частично помогать в сопоставлении рукописей.
Одной из проблем является отсутствие подходящих инструментов для фиксации различий между версиями текста. Сейчас это делается вручную — на бумаге или в текстовых редакторах вроде Word, после чего передаётся наборщику или вводится самим исследователем.
Мы проанализировали и спроектировали такие инструменты и сейчас занимаемся их разработкой, хотя этот процесс требует времени.
Должен существовать инструмент, позволяющий фиксировать различия между рукописями. Также может быть инструмент, предлагающий варианты слов — это одна из проблем научной работы: в рукописи встречается слово, которое трудно распознать, и исследователь вынужден угадывать его в пределах своего словарного запаса.
Если же будет система, обладающая широким словарным запасом и способная предложить варианты, например: если первая буква похожа на «с» или «з», а вторая неясна, система могла бы предложить возможные варианты. Это было бы крайне полезно.
Таким образом, можно было бы извлечь десятки или даже сотни слов, соответствующих данной структуре.
Искусственный интеллект на службе критического издания текстов
С использованием искусственного интеллекта мы разрабатываем набор инструментов, которые облегчат процесс редактирования и восстановления текстов.
Потому что в нынешнем состоянии работа с рукописями крайне сложна, и только специалисты могут ими пользоваться. Не все могут получить доступ к этим источникам.
Но когда эти тексты будут отредактированы, восстановлены, набраны и систематизированы, они станут доступны для всех. Однако на этапе рукописей их использование остаётся сложным и ограниченным для широкой аудитории.
Если процесс возрождения (издания и восстановления текстов) будет осуществляться таким образом, что он будет занимать одну пятую или одну десятую нынешнего времени, то в случае, если за десять лет мы сможем, например, восстановить тысячу или десять тысяч книг, такая производственная мощность потенциально может привести к возрождению ста тысяч книг. Это также является одним из этапов работы.
Я хочу сказать вам, что всё это — комплекс мер, которые сейчас реализуются в области рукописей. И, как я уже говорил, первый этап — это создание единой базы рукописей, которую можно назвать «интеллектуальной единой платформой рукописей».
Интеллектуальная платформа как ускоритель восстановления рукописей
На этом этапе мы стремимся максимально охватить все рукописи, существующие в стране. На первом этапе уже проведены переговоры с несколькими крупными библиотеками. Библиотека университета выразила готовность, Библиотека парламента также выразила готовность, соответствующие договоры подготовлены или находятся на стадии подписания.
Национальная библиотека также заявила, что после рассмотрения, вероятно, присоединится к проекту. Помимо них существуют и небольшие, разрозненные библиотеки внутри страны, работа с которыми гораздо сложнее, поскольку многие из них закрыты, а их ответственные лица должны быть сначала выявлены и установлены.
Эта работа уже ведётся, и, по милости Божьей, мы надеемся, что к концу первого полугодия этого года или в начале второго полугодия будет запущена первая версия этой платформы, и исследователи смогут ею пользоваться. Затем будут постепенно реализованы дальнейшие этапы.
Начало сотрудничества с крупными библиотеками страны
Параллельно с этим и как дополняющий проект в центре формируется ещё одна система, которая, по милости Божьей, будет запущена даже раньше. Эта система называется «платформа аль-Фихрист».
Учёные раннего исламского мира, когда хотели говорить о произведениях, источниках и письменном наследии исламского мира или представлять их, использовали термин «фихрист» (каталог). Например, «Фихрист» Ибн ан-Надима — один из самых известных, также «Фихрист» ан-Наджаши. Это названия научных каталогов и трудов, которые писали великие учёные исламского мира. Мы также заимствовали эту традицию и назвали систему «аль-Фихрист».
«Аль-Фихрист» — возрождение древней традиции в новой форме
Эта платформа станет самой полной научной метаданной базой исламского мира. Как я уже говорил, у нас есть книжные источники, журналы, диссертации, и к этому добавятся рукописи.
Однако метаданные — это не только то, к чему у нас есть цифровые тексты. Книг в исламском мире гораздо больше.
Нам необходимо собрать все описательные и библиографические данные исламского мира в одном месте, чтобы если студент или исследователь ищет тему, он мог ввести запрос и система показала бы ему, что по этой теме существует, например, двадцать книг.
При этом не обязательно, что все эти книги оцифрованы в центре «Нур» — возможно, мы не смогли получить к ним доступ или решить вопросы авторских прав, и поэтому они не включены в нашу систему. Но информация о самом существовании этих книг должна быть доступна.
Таким образом, цель — создать единую базу всех метаданных и источников исламского мира, часть которой будет включать рукописи внутри и за пределами страны. Это будет единый банк научных данных исламского мира.
Эта система также будет взаимодействовать с платформой рукописей и обслуживать её.
Например, по конкретной рукописи можно будет увидеть, что в нашей базе есть две или три копии, но в мире может существовать ещё десять копий — в Египте, Турции, Йемене или европейских странах. В этом случае у нас будет доступ только к метаданным.
Платформа «аль-Фихрист» также будет, по милости Божьей, официально представлена. Подготовительные работы практически завершены, и мы надеемся, что она будет запущена в течение ближайших одного-двух месяцев.
Самая крупная база научных данных исламского мира
В заключительной части я хотел бы упомянуть некоторые недавние работы. В области технологий возникло новое пространство и появились новые возможности. После появления чат-ботов и технологической революции в сфере искусственного интеллекта, а также произошедшего скачка в этой области, все наши усилия направлены на то, чтобы максимально использовать этот потенциал.
Мы также начали ряд работ. Ранее у нас была платформа под названием «Комплексная база Корана», в которой были собраны все тафсиры, переводы и исследования, связанные с кораническими аятами. С появлением чат-ботов мы использовали этот потенциал и запустили раздел «Диалог с тафсирами».
Внедрение искусственного интеллекта в исследовательские услуги центра
Теперь человек с любым уровнем знаний, любым языком и любым стилем речи может использовать эту систему. Раньше, если кто-то не знал арабского, он не мог обращаться к арабским книгам; если не знал персидского — не мог пользоваться персидскими источниками; если не имел философской подготовки — не мог использовать некоторые тафсиры, имеющие философский характер и очень научный язык.
Но теперь, с появлением этого специализированного чат-бота по тафсирам, можно входить в систему с любым уровнем знаний и задавать вопросы.
Например, можно спросить: «Что сказали толкователи об этом аяте?» или попросить объяснить его на простом уровне. Система использует весь массив доступных тафсиров.
Можно также запросить мнение Фахра ар-Рази об этом аяте, или мнение суннитских учёных, или шиитских, или попросить лингвистическое объяснение, либо анализ с социальной, политической и других точек зрения.
Этот чат-бот, созданный специально для Корана, отличается от общих систем вроде GPT. Общие системы работают с большими массивами данных, где могут быть ошибочные, «желтые» или даже сгенерированные самими моделями сведения.
Здесь же система строго ограничена конкретными источниками. Промпт и архитектура построены таким образом, что используется только проверенная база данных. Каждое утверждение сопровождается ссылкой на источник, и пользователь может нажать на неё и открыть страницу книги.
Внедрение ИИ в работу с хадисами
Аналогичная система создана и в области хадисов. Ранее у нас была «Комплексная база хадисов», где были собраны все предания. Сейчас чат-бот работает поверх этой базы.
Например, по современным темам, таким как «устойчивость» (resilience), вы можете искать соответствующие смыслы в хадисах, даже если сам термин напрямую не встречается.
Можно уточнить вопрос: что Имам Садик (мир ему) говорил об устойчивости. Система анализирует и выявляет глубокие смысловые слои хадисов, которые даже опытный исследователь может не связать с данной темой.
Мы также тестировали это на теме «страхования». Страхование — современное понятие, но система извлекла из хадисов идеи о необходимости откладывать на будущее и готовиться к трудным временам.
Извлечение современных понятий из хадисов
Также мы запустили «диалог с книгами». Сейчас в системе NoorLib доступна функция общения с книгами.
Недавно, после мученической гибели Имама, Его Светлости аятоллы аль-узмы Сейеда Али Хаменеи, мы запустили диалог и с его трудами.
У нас были собраны его высказывания — до революции, после революции, в период руководства и ранее. Также использовались материалы, опубликованные Институтом исламской революции.
Все эти материалы были объединены и обработаны, что дало очень хороший результат. Поскольку всё, что публикуется о Верховном руководителе, должно быть одобрено соответствующим институтом, материалы были переданы им.
Они предварительно подтвердили корректность системы, хотя указали, что некоторые новые материалы и заявления необходимо добавить. Вероятно, это будет сделано в ближайшее время.
Фактически мы стремимся к тому, чтобы до церемонии похорон результат этой системы был доступен публично.
Сейчас доступ к системе уже открыт в тестовом режиме. Это лишь часть уже выполненных работ. Помимо этого, ведутся и другие масштабные проекты, которые могут стать темой отдельного интервью — например, работы в области персидской литературы.
Развитие «диалога с книгами» и трудов личностей
Также в области фикха разрабатывается важный инструмент, который будет помогать тем, кто выносит религиозные решения (фетвы).
Процесс начинается с самого начала: есть ли аят по данному вопросу, использовали ли его факихи, какие хадисы относятся к теме и как они интерпретировались.
Также проводится глубокая работа по проверке цепочек передатчиков хадисов. У нас есть 40-летний массив исследований, подготовленный для технологической обработки.
Теперь, благодаря современным технологиям, большим языковым моделям и NLP, можно объединять и анализировать эти данные. Раньше их можно было только искать отдельно, но теперь система может сопоставлять их и анализировать вместе.
В результате муджтахид перед вынесением фетвы сможет увидеть, как данная тема развивалась за 1300–1400 лет истории исламской мысли, и принимать решение с большей точностью и глубиной.
Конец сообщения.
Ваше мнение